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gesghireibung 

Verfahren und Vorrichtung zur Spracherkennung 

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Spracherkennung . 

Ein Spracherkennungssystem ist aus [1] bekannt . Dort finden 
sich auch eine grundlegende Einfuhrung der an dem 
Spracherkennungssystem beteiligten Komponenten sowie 
wichtiger, bei der Spracherkennung iiblicher Techniken. 

Bei einem bekannten Spracherkennungssystem ist eine 
Genauigkeit, also ein MaS fur eine Qualitat der Erkennung, 
vorgegeben. Der Benutzer muS nun mit diesem System auskommen, 
auch wenn fur seine Anwendung eine verminderte Genauigkeit 
ausreichen, dafiir er aber eine hohere 
Bearbeitungsgeschwindigkeit erzielen wurde . 

Das Prinzip des Pruning eines Suchraums ist aus [2] (siehe 
Kapitel 3.3.3, Seite 40) bekannt. Dabei handelt es sich urn 
ein "Beschneiden" des Suchraums, also eine Methode zur 
Reduzierung einer Anzahl von Suchpfaden des Suchraums, wobei 
diejenigen Suchpfade. abgeschnitten werden, die wenig 
aussichtsreich sind. Zuerst wird dazu ein Suchpfad mit 
minimalen Kosten (optimaler Suchpfad) ermittelt. Daraufhin 
werden alle Suchpfade (Aste des Suchbaums) weggeschnitten, 
deren Kosten oberhalb des Minimums zuziiglich einer addierten 
vorgegebenen BewertungsgroSe , die als Pruning-Schwelle 
bezeichnet wird, liegen. Fur eine detaillierte Erklarung des 
Prunings : [2], Seite 40ff., insbesondere Bild 16 auf 
Seite 41. 

Bei Verwendung der Pruning-Schwelle ist nicht bekannt, 
wieviel Suchpfade in dem Suchbaum iibrig bleiben. Will man die 
Anzahl dieser ubrigbleibenden Suchpfade auf einem 
vorgegebenen Niveau halten, wird die Pruning-Schwelle 
dynamisch angepaSt . 
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Ein Histogramm- Pruning ist aus [3] oder [4] bekannt . Hier 
werden eine vorgegebene Anzahl "bester" Suchpfade, also 
Suchpfade mit einer hohen Auf trittswahrscheinlichkeit , 
5 verwendet, indem Haufigkeiten der Suchpfade in Form eines 
Histogramms bewertet werden. Die Pruning-Schwelle wird 
dynamisch verandert . 

Eine akustische Vorausschau im Suchbaum (Fachwort: Fast-Look- 

10 Ahead) ist aus [5] oder [6] bekannt. 

Die bei der akustischen Vorausschau (auch schnelle 
Vorauswahl) verfolgte Idee beruht auf der Eigenschaft einer 
Sprache, date sich alle Worter aus einem beschrankten Inventar 
von Unterworteinheiten (z.B. Phonemen, Halbsilben) 

15 zusammensetzen . Fur diese Unterworteinheiten wird nun 11 im 

Voraus" eine akustische Bewertung durchgef uhrt . Es werden nur 
diejenigen Kombination von Unterworteinheiten weiterverf olgt , 
deren akustische Bewertungen jeweils unterhalb einer 
vorgegebenen Schwelle liegen. Ein Gewinn im Bewertungsauf wand 

20 besteht darin, daS fur eine geringe Anzahl von Unterwort- 
einheiten ein MaS fur die Ubereinst immung eines zu 
erkennenden Sprachsignals mit einer ZielgroSe im voraus 
berechnet und als Grundlage fur eine Entscheidung 
herangezogen wird, ob ein GroSteil des Suchbaums nicht weite 

25 beriicksichtigt werden soil. Anschaulich gesprochen bedeutet 
dies, dafi mehr Suchpfade im Suchbaum eingespart werden, als 
durch die Vorausberechnung hinzukommen. Ein derartiger Gewinn 
wird umso groSer, je hoher das Verhaltnis von neuen 
Wortanfangen zu einer Anzahl von Unterworteinheiten wird. 

30 Dieses Verhaltnis steigt mit der Anzahl der zu erkennenden 
Unterworteinheiten bzw. Worter (LexikongroSe ) . 

Ein Vorteil des Verfahrens der akustischen Vorausschau 
besteht in der Regularitat der Algorithmen zur Berechnung der 
3 5 ent sprechenden MaSe . Da keine Verzweigungen durch Wortenden, 
Syntaxknoten, etc. im Suchraum auftreten, ist das Schema der 
Berechnung der MaJSe regular. Gerade deshalb bietet sich ein 
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solches Verfahren auch fur eine Implementierung in Hardware 
an. 

Die Vorausberechnung der MaSe (Fachwort: Fast -Match-Scores) 
wird dadurch moglich, dafi die eigentliche Suche urn eine feste 
Anzahl von Zeitfenstern hinter den aktuellen extrahierten 
MaSen des Sprachsignals hinterhereilt . Mit den aktuellen 
MaSen wird die Vorausberechnung der MaSe weiterer 
Unterworteinheiten durchgefiihrt (siehe [5] , Seite 65, Bild 
33). 

Auch in Sprachmodellen ist die Durchfuhrung einer derartigen 
Vorausschau bekannt (siehe [6] ) . 

Das Prinzip der Vorausschau im Sprachmodell (Fachwort: 
Language-Model-Look-Ahead) ist die Berucksichtigung der im 
Sprachmodell vorhandenen Wahrscheinlichkeiten in dem 
Suchprozefi so friih wie moglich, auch in dem assoziierten 
Pruning. Dies wird erreicht durch eine Faktorisierung der 
Wahrscheinlichkeiten im Sprachmodell. Eine detaillierte 
Beschreibung mit einer formalen Notation ist in [6] 
enthalten. 

SchlieSlich ist z.B. aus [7] eine Schwelle zur Auswahl 
berechnender Distanzparameter bekannt. Derartige 
Auswahlverfahren sind generell mehrstufig angelegt. Zuerst 
wird eine grobe Berechnung mit einem Teil der Distanzen 
durchgefiihrt . Im nachsten Schritt werden dann diejenigen 
Distanzen bestimmt, die beziiglich eines Abstandsma&es nahe an 
der besten Distanz des ersten Berechnungsschrittes liegen. 
Dieses AbstandsmaS kann uber eine Schwelle variiert werden, 
wodurch der Berechnungsauf wand fur die Bestimmung der 
Distanzparameter variiert wird. 



Die Aufgabe der Erfindung besteht darin, ein Verfahren und 
eine Vorrichtung zur Einstellung der Genauigkeit des 
Spracherkennungssystems zu schaffen. 
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Dieses Aufgabe wird gemaS den Merkmalen der unabhangigen 
Patentanspruche gelost . 

Es wird ein Verfahren zur Einstellung einer Genauigkeit eines 
5 Spracherkennungssys terns angegeben, bei dem durch eine 
vorgebbare EingangsgroSe die Genauigkeit bestimmt wird. 
Anhand dieser EingangsgroSe werden Werte fur Systemparameter 
des Spracherkennungssystems , vorzugsweise mittels eines 
Rechners, ermittelt . Anhand dieser Werte wird das 
10 Spracherkennungssystem eingestellt. Dies geschieht 
vorzugsweise automatisch durch den Rechner. 

Somit ist es ein Vorteil der Erfindung, die Genauigkeit des 
Spracherkennungssystems adaptierbar und zugleich fur den 
15 Laien einstellbar zu machen. Je nach Anwendung bzw. je nach 
Rechenleistung, die fur das Spracherkennungssystem auf dem 
Rechner bereitsteht, konnen unterschiedliche Anf orderungen an 
die Qualitat des Spracherkennungssystems einfach durch 
Adaption der EingangsgroSe vorgenommen werden. 

20 

Eine Weiterbildung besteht darin, daS gemaS einer 
Abbildungsvorschrif t aus der EingangsgroSe die Werte fur die 
Systemparameter des - Spracherkennungssystems ermittelt werden. 
Dabei kann diese Abbildungsvorschrif t anhand einer Tabelle 
25 umgesetzt sein. 

Es ist also moglich, durch Einstellung der EingangsgroSe 
automatisch die damit verkniipften Werte der Systemparameter 
des Spracherkennungssystems zu ermitteln und automatisch dem 
3 0 Spracherkennungssystem zuganglich zu machen. Das Ablegen der 
Werte in einer Tabelle hat den Vorteil, daS eine individuelle 
Anpassung verschiedener Werte der EingangsgroSe zu jeweils 
verschiedenen Werten der Systemparameter durchgefuhrt werden 
kann . 

35 

Eine andere Weiterbildung besteht darin, die Einstellung 
wahrend des Betriebs des Spracherkennungssystems 
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durchzufuhren. Dabei ergibt sich vorteilhaf t , daS die 
Anpassung des Spracherkennungssystems individuell nach den 
jeweiligen Anf orderungen wahrend des Betriebs des 
Spracherkennungssystems angepaSt werden kann. 

Eine zusatzliche Weiterbildung der Erfindung besteht darin, 
dafi mindestens einer der folgenden Systemparameter anhand der 
Eingangsgrofie bestimmt wird: 

a) Pruning- Schwelle ; 

b) Histogramm- Pruning ,- 

c) akustische Vorausschau; 

d) Vorausschau im Sprachmodell ; 

e) Schwelle zur Auswahl zu berechnender Distanzparameter . 

Zur Bedeutung und Funktion dieser Systemparameter wird auf 
die Einleitung verwiesen. 

Die angefiihrten Systemparameter stellen eine Auswahl von 
Moglichkeiten dar. Es sind andere Systemparameter 
vorstellbar, die, abhangig von dem jeweiligen 
Spracherkennungssystem, von den oben genannten verschieden 
sein konnen . 

Auch ist es eine Weiterbildung der Erfindung, dafi die 
Systemparameter hinsichtlich ihres Einflusses auf eine 
ZielgroSe hin gewichtet werden. Dabei kann die Zielgrofie 
beispielsweise eine Genauigkeit des Spracherkennungssystems 
Oder eine Geschwindigkeit des Spracherkennungssystems (also 
die Geschwindigkeit zur Durchfuhrung des 
Spracherkennungsprozesses) sein. Im Hinblick auf die 
jeweilige ZielgroSe konnen die Systemparameter anteilig 
gleich oder entsprechend einer vorgegebenen 
Gewichtungstabelle unterschiedlich gewichtet werden. 

Im Rahmen einer anderen Weiterbildung wird die EingangsgroSe 
anhand eines Einstellelements bestimmt. 
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Vorzugsweise weist das Einstellelement einen eindimensionalen 
Freiheitsgrad mit zwei Begrenzungen auf, wobei die erste 
Begrenzung als maximale Genauigkeit des 
Spracherkennungssystems und die zweite Begrenzung als 
5 maximale Geschwindigkeit des Spracherkennungssystems 
umgesetzt werden. 

Auch ist es eine Weiterbildung des Verfahrens, daS das 
Einstellelement auf einem Rechner als ein Schieberegler 
10 dargestellt wird und anhand einer Tastatur, eines Touch- Pads 
oder einer Maus bedient wird. 

Auch kann das Einstellelement ein Drehregler, ein 
Schieberegler oder Potentiometer sein. 

15 

In einer zusatzlichen Weiterbildung wird das Einstellelement 
uber Sprache angesteuert, die von einem Spracherkenner , 
insbesondere dem Spracherkennungssystem, ausgewertet wird. 
Die EingangsgroSe kann mittels Spracheingabe bestimmt werden. 

20 

Das Verfahren wird auch weitergebildet , indem eine 
vollstandig automatisierte Bestimmung der EingangsgroSe in 
den folgenden Schritten durchgefuhrt wird: ~" " 

Eine Leistungsf ahigkeit des Rechners, auf dem das 

25 Spracherkennungssystem ablaufen soil, wird anhand eines 
Programms zur Leistungsermitt lung bestimmt und als ein 
Leistungsindex abgespeichert . Unter Beriicksichtigung des 
Leistungsindex werden die Systemparameter des 
Spracherkennungssystems automatisch eingestellt und dadurch 

30 wird eine leistungsf ahige Spracherkennung unter z.B. 
Echtzeitbedingung gewahrleistet . 

Ein Programm zur Bestimmung der Leistungsf ahigkeit des 
Rechners kann eine vorgegebene Schleife sein, die eine 
bestimmte Anzahl Iterationen durchlauft, wobei die Zeit fur 

3 5 die Iterationen gemessen wird. Anhand einer Tabelle kann 

abhangig von der gemessenen Zeit der Leistungsindex bestimmt 
werden. Auch gibt es kommerziell oder als Freeware verfiigbare 
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Programme, die die Leistungsf ahigkeit des Rechners ermitteln 
und als eine Bewertungsgrofie der Leistungsf ahigkeit einen 
Leistungsindex ausgeben. 

Auch wird eine Vorrichtung zur Spracherkennung angegeben, die 
ein Spracherkennungssystem aufweist und mit einem Mittel zur 
Einstellung einer Genauigkeit des Spracherkennungssystems 
ausgefiihrt ist, welches Mittel Systemparameter des 
Spracherkennungssystem aus einer EingangsgroSe umsetzt, also 
die Einstellung des Spracherkennungssystems und seiner 
zahlreichen Systemparameter anhand der EingangsgroSe 
vornimmt . 

Dabei ist es vorteilhaft, daS eine solche Einstellung der 
Systemparameter anhand der EingangsgroSe wahrend des Betriebs 
des Spracherkennungssystems erfolgen kann. So wird fur den 
Benutzer eine einfache Anpassung der Vielzahl von 
Systemparametern moglich. 

Die EingangsgroSe ist in einer Weiterbildung automatisch 
bestimmbar. Dazu wird anhand einer Einrichtung zur 
Leistungsmessung des Rechners, auf dem das 
Spracherkennungssystem ablauft, ein sog. Leistungsindex 
ermittelt und zur Einstellung der Genauigkeit des 
Spracherkennungssystems benutzt . 

Eine andere Weiterbildung sieht vor, daS die EingangsgroSe 
durch ein Einstellelement vorgebbar ist. Dazu sind eine 
Vielzahl moglicher Einstellemente (Potentiometer, virtuelle 
Steuereinheiten auf dem Rechner, etc.) denkbar, deren 
Einstellung direkt die Genauigkeit des 
Spracherkennungssystems bestimmt . 

Vorteilhaft konnen Schritte des erf indungsgemaSen Verfahrens 
auf der angegebenen Vorrichtung durchgefiihrt werden. 
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Weiterbildungen der Erfindung ergeben sich auch aus den 
abhangigen Anspriichen. 

Anhand der folgenden Figuren werden Ausf iihrungsbeispiele der 
5 Erfindung naher dargestellt. 

Es zeigen 

Fig.l eine Systemarchitektur fur ein 
10 Spracherkennungssystem; 

Fig. 2 ein Blockdiagramm mit Schritten eines Verfahrens zur 
Einstellung der Genauigkeit eines 
Spracherkennungssystems ; 

15 

Fig. 3 ein Blockdiagramm, das eine Verkniipfung einer 

EingangsgroSe mit mindestens einem Systemparameter 
liber eine Abbildungsvorschrif t darstellt; 

20 Fig. 4 ein Diagramm, das verschiedene mogliche 

Systemparameter des Spracherkennungssystems 
darstellt ; 



Fig. 5 eine Skizze, die den EinfluS der Systemparameter auf 
25 eine ZielgroSe darstellt; 

Fig. 6 ein Diagramm, das verschiedene Moglichkeiten zur 
Einstellung der EingangsgroSe darstellt; 

30 Fig. 7 ein Spracherkennungssystem mit einem Mittel zur 
Einstellung der Genauigkeit. 

In Fig. 1 ist allgemein eine Systemarchitektur fur eine 
Spracherkennung (Spracherkennungssystem) dargestellt . 



35 



Voraussetzung fur die Erkennung naturlich gesprochener 
Sprache ist ein geeigneter Formalismus zur 
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Wissensreprasentation . Ein vollstandiges 

Spracherkennungs system umfaSt mehrere Verarbeitungsebenen . 
Dies sind insbesondere Akustik- Phone tik, Intonation, Syntax, 
Semantik und Pragmatik. In Fig.l werden die 
Verarbeitungsebenen bei der Erkennung aufgezeigt. 

Das naturliche Sprachsignal 101 gelangt in das 
Spracherkennungssystem. Dort wird in einer Komponente 102 
eine Merkmalsextraktion durchgef uhrt . Nach der 
Merkmalsextraktion werden anhand bekannter akustisch- 
phonetischer Einheiten 103 Sprachlaute erkannt (siehe Block 
104) . Dabei handelt es sich urn die Berechnung akustischer 
Distanzparameter . Nach der Sprachlauterkennung 104 erfolgt 
die lexikalische Decodierung (Worterkennung) in einem Block 
106 mit Hilfe des Aussprachemodells bzw. Wortlexikons 105 und 
daran anschliefiend eine Syntaxanalyse 108 mit Hilfe des 
Sprachmodells, das die Grammatik umfaSt, 107. Die 
Worterkennung 106 und die Syntaxanalyse 108 stellen die Suche 
nach einer Entsprechung fur das Sprachsignal dar. SchlieSlich 
wird in einem Block 110 eine semantische Nachbearbeitung 
durchgef uhrt, wobei Kontextwissen und Pragmatik 109 
berucksichtigt werden und schlieSlich die vom 
Spracherkennungssystem erkannte Sprache 111 f olgt . 

In Fig, 2 ist ein Blockdiagramm dargestellt, das Schritte 
eines Verfahrens zur Einstellung der Genauigkeit eines 
Spracherkennungssystems zeigt . 

In einem Schritt 2 01 wird durch eine vorgebbare EingangsgroSe 
die Genauigkeit des Spracherkennungssystems bestimmt. 
Daraufhin wird in einem Schritt 202 anhand dieser 
EingangsgroSe fur Systemparameter des Spracherkennungssystems 
Werte ermittelt . SchlieSlich wird in einem Schritt 203 das 
Spracherkennungssystem anhand der ermittelten Werte 
eingestellt . 
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Fig. 3 zeigt ein Blockdiagramm, das eine Verkniipfung einer 
EingangsgroSe iiber eine Abbildungsvorschrif t mit mindestens 
einem Systemparameter darstellt. 

Die erwahnte EingangsgroSe 3 01 wird anhand einer 
5 Abbildungsvorschrif t 3 02 auf die Systemparameter SP 3 03 des 
Spracherkennungssystems abgebildet. Dabei wird vorzugsweise 
eine EingangsgroSe 3 01 mehreren Systemparametern iiber die 
Abbildungsvorschrif t zugeordnet . Durch diese 
Abbildungsvorschrif t 3 02 wird durch Vorgabe einer 

10 EingangsgroSe das Spracherkennungssystem angepaSt, also 

werden mehrere Systemparameter SP durch Veranderung einer 
EingangsgroSe 301 beeinfluSt. Die Abbildungsvorschrif t 302 
hat vorzugsweise die Form einer Tabelle, in der eine Spalte 
mogliche EingangsgrdSen 3 01 enthalt, und in einer Zeile 

15 dieser Spalte der jeweiligen EingangsgroSe mehrere Werte fur 
Systemparameter SP 303 zugeordnet werden. Die 
Abbildungsvorschrif t 302 besteht im Suchen nach dem der 
EingangsgroSe 3 01 zugeordneten Eintrag (Zeile) in der Tabelle 
und in der Ubergabe der gefundenen Werte fur Systemparameter 

2 0 SP 3 03 an das Spracherkennungssystem. 

Fig. 4 zeigt ein Diagramm, das verschiedene mogliche 
Systemparameter des Spracherkennungssystems darstellt. Die 
Systemparameter SP des Spracherkennungssystems, dargestellt 
25 in einem Block 401, umfassen mindestens einen der folgenden 
Parameter : 



e) Schwelle fur Distanzparameter 406. 

Insgesamt sind weitere Systemparameter des 
Spracherkennungssystems zur Einstellung iiber die 
35 EingangsgroSe 301 denkbar, angedeutet durch den Block 407. 



30 



a) Pruning-Schwelle 402; 

b) Histogramm- Pruning 403 ; 

c) akustische Vorausschau 404; 

d) Vorausschaum im Sprachmodell 405; 
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Fig- 5 zeigt eine Skizze, die den EinfluS der Systemparameter 
auf eine ZielgroSe darstellt. 

Die Systemparameter SP (siehe Block 501) nehmen EinfluS auf 
eine ZielgroSe ZG (siehe Block 502) . Wie oben beschrieben, 
gibt es mehrere Systemparameter SPI, SP2 , usw., dargestellt 
in einem Block 503. Dabei nimmt jeder einzelne 
Systemparameter SPi (1=1,2,...) mittels eines fur den 
jeweiligen Systemparameter SPi vorgesehenen Gewichts Gi 
(dargestellt in einem Block 504) EinfluS auf die ZielgroSe 
ZG. Durch die Gewichtung der Systemparameter SP ist es 
moglich, je nach Systemparameter SP einen unterschiedlichen 
EinfluS auf die ZielgroSe ZG zu nehmen. 

In Fig. 6 ist ein Diagramm dargestellt, das verschiedene 
Moglichkeiten zur Einstellung der EingangsgroSe zeigt. Die 
Einstellung der EingangsgroSe, dargestellt in dem Block 601, 
erfolgt anhand von Bedienkomponenten des Rechners R (siehe 
Block 602) , anhand von Regelungskomponenten 603 oder anhand 
des Rechners selbst (siehe Block 604) . Der Rechner R umfaSt 
dazu mindestens ein Mittel zur Einstellung der EingangsgroSe, 
wie eine Tastatur 605, eine Maus 606, ein Touch-Pad 607 oder 
Spracheingabe 608 iiber das Spracherkennungssystem . Mogliche 
Komponenten zur Regelung, dargestellt in dem Block 603 sind 
ein Drehregler 609, ein Schieberegler 610 oder ein sonstiger 
Regler 611, vorzugsweise ein Potentiometer. Zusatzlich wird 
automatisch anhand eines Programms , das auf dem Rechner 
lauft, die Rechenleistung des Rechners ermittelt und die 
EingangsgroSe zur Einstellung des Spracherkennungssystems 
entsprechend bestimmt. Dadurch wird gewahrleistet, daS ein 
automatisch eingestellter Rechner eine seiner Rechenleistung 
entsprechende Qualitat bei der Spracherkennung gewahrleistet. 
Automatisch wird ein KompromiS gefunden zwischen hoher 
Qualitat bei der Spracherkennung, unter EinbuSe von 
Rechenleistung bzw. Echt zeiterkennung der Sprache, und 
schneller Spracherkennung mit entsprechend wenig Bedarf an 
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Rechenleistung allerdings deutlicher QualitatseinbuSe bei der 
Spracherkennung . 

Fig, 7 zeigt eine Vorrichtung aus einem Spracherkennungssystem 
5 701 und einem Mittel zur Einstellung der Genauigkeit des 
Spracherkennungssystems 702 . 

Anhand des Mittels zur Einstellung der Genauigkeit 702 sind 
durch eine EingangsgroSe Systemparameter des 

10 Spracherkennungssystems bestimmt. Dazu wird die 

EingangsgroSe , vorzugsweise anhand einer vorgegebenen 
Tabelle, einer Vielzahl von Systemparametern (Pruning- | 
Schwelle , His togramm- Pruning, akustische Vorausschau, 
Vorausschau im Sprachmodell , Schwelle zur Auswahl zu 

15 berechnender Distanzparameter , etc.) zugeordnet . 



Die EingangsgroSe ist wahlweise anhand eines Einstellelements 
703 oder einer Einrichtung zur Leistungsbestimmung des 
Rechners 704 bestimmbar. Hierbei sei auch auf Fig. 6 und die 
2 0 dort angegebenen Moglichkeiten zur Einstellung der 
Eingangsgrofie verwiesen . 
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Im Rahmen dieses Dokuments wurden folgende Verof f ent lichungen 
zitiert : 

[1] A. Hauenstein: "Optimierung von Algorithmen und Entwurf 
eines Prozessors fur die automatische Spracherkennung" , 
Lehrstuhl fur Integrierte Schaltungen, Technische 
Universitat Munchen, Dissertation, 19.07.1993, Kapitel 2, 
Seiten 13 bis 26. 

[2] A. Hauenstein: "Optimierung von Algorithmen und Entwurf 
eines Prozessors fur die automatische Spracherkennung" , 
Lehrstuhl fur Integrierte Schaltungen, Technische 
Universitat Munchen, Dissertation, 19.07.1993, Kapitel 
3.3.3, Seiten 40 bis 43. 

[3] Volker Steinbiss, Bach-Hiep Tran, Hermann Ney: 

" Improvements in Beam Search. Proc . Intl. Conf . Speech 
and Language Processing, Yokohama 1994, Seiten 2143 bis 
2146 . 

[4] M. Niemoller, A. Hauenstein, E. Marschall, P. Witschel, 
U. Harke: "A PC-based Real-Time Large Vocabulary 
Continuous Speech Recognizer for German", Proc. IEEE 
Intl. Conf. on Acoustics, Speech and Signal Processing; 
Munchen 19 97. 

[5] A. Hauenstein: "Optimierung von Algorithmen und Entwurf 
eines Prozessors fur die automatische Spracherkennung", 
Lehrstuhl fur Integrierte Schaltungen, Technische 
Universitat Munchen, Dissertation, 19.07.1993, Kapitel 
3.5.1, Seiten 65 bis 69. 

[6] S. Ortmanns, A. Eiden, H. Ney, N. Coenen: "Look-Ahead 

Techniques for Fast Beam Search", Proc. IEEE Intl. Conf. 
on Acoustics, Speech and Signal Processing; Munchen 1997, 
Seiten 1783 bis 1786. 

[7] E. Bocchieri: "Vector Quantization for the Efficient 
Computation of Continuous Density Likelihoods", Proc. 
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IEEE Intl. Conf . on Acoustics, Speech and Signal 
Processing; 1993, Seiten 11-692 bis 11-695. 



GR 97 P 2935 




15 

Patentanspruche 

1. Verfahren zur Spracherkennung, 

bei dem gesprochene Sprache anhand eines 
Spracherkennungssystems erkannt wird, wobei 

a) anhand einer vorgebbaren EingangsgroSe eine 
Genauigkeit bestimmt wird; 

b) anhand der EingangsgroSe Werte fur Systemparameter des 
Spracherkennungssystems ermittelt werden; 

c) anhand der Werte die Genauigkeit des 
Spracherkennungssystem eingestellt wird. 

2. Verfahren nach Anspruch 1, 

bei dem die Werte fur die Systemparameter des 
Spracherkennungssystems bestimmt werden, indem gemaS 
einer Abbildungsvorschrif t aus der EingangsgroSe die 
Werte ermittelt werden. 

3 . Verfahren nach Anspruch 2 , 

bei dem die Abbildungsvorschrif t anhand einer Tabelle 
umgesetzt wird. 

4. Verfahren nach einem der vorhergehenden Anspruche, 
bei dem die Einstellung wahrend des Betriebs des 
Spracherkennungssystems durchgef iihrt wird . 

5. Verfahren nach einem der vorhergehenden Anspruche, 

bei dem das Spracherkennungssystem mindestens einen der 
folgenden Systemparameter umf aSt : 

a) Pruning-Schwelle ; 

b) Hi stogramm- Pruning; 

c) akustische Vorausschau; 

d) Vorausschau im Sprachmodell ; 

e) Schwelle zur Auswahl zu berechnender Distanzparameter . 
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6. Verfahren nach Anspruch 5, 

bei dem mindestens einer der Systemparameter anhand der 
Eingangsgrofie bestimmt wird. 

5 7. Verfahren nach Anspruch 6, 

bei dem die Systemparameter gewichtet werden hinsichtlic 
ihres Einflusses auf jeweils eine ZielgroSe. 

8. Verfahren nach Anspruch 7, 
10 bei dem eine ZielgroSe mindestens eine der folgenden 

GroSen ist : 

a) Genauigkeit des Spracherkennungssystems ; 

b) Geschwindigkeit des Spracherkennungssystems. 

15 9. Verfahren nach Anspruch 7 oder 8, 

bei dem die Systemparameter gleich gewichtet werden. 

10. Verfahren nach Anspruch 7 oder 8, 

bei dem die Systemparameter entsprechend einer 

2 0 vorgegebenen Gewichtungstabelle gewichtet werden. 

11. Verfahren nach einem der vorhergehenden Anspriiche, 

bei dem die EingangsgroSe anhand eines Einstellelements 
bestimmt wird. 

25 

12. Verfahren nach Anspruch 11, 

bei dem das Einstellelement einen eindimensionalen 
Freiheitsgrad mit zwei Begrenzungen aufweist, dessen 
erste Begrenzung als maximale Genauigkeit des 

3 0 Spracherkennungssystems und dessen zweite Begrenzung als 

maximale Geschwindigkeit des Spracherkennungssystems 
umgesetzt werden. 

13. Verfahren nach Anspruch 11 oder 12, 

35 bei dem das Einstellelement auf einem Rechner als ein 

Schieberegler dargestellt und anhand einer Tastatur, 
eines Touch- Pads oder einer Maus bedient wird. 
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14. Verfahren nach Anspruch 11 oder 12 , 

bei dem das Einstellelement ein Drehregler, Schieberegler 
oder ein Potentiometer ist . 

15. Verfahren nach Anspruch 11 oder 12, 

bei dem das Einstellelement iiber Sprache angesteuert 
wird, die von einem Spracherkenner, insbesondere dem 
Spracherkennungssystem, ausgewertet wird. 

16. Verfahren nach einem der Anspriiche 1 bis 10, 

a) bei dem das Spracherkennungssystem auf einem Rechner 
ablauf t ; 

b) bei dem durch ein Programm zu einer 
Leistungsermittlung des Rechners ein Leistungsindex 
des Rechners bestimmt wird; 

c) bei dem die EingangsgroSe fur das 
Spracherkennungssystem automatisch anhand des 
Leistungsindex bestimmt wird, wobei dabei eine 
Rechenleistung des Rechners automatisch auf die 
Genauigkeit des Spracherkennungs systems eingestellt 
wird . 

17. Vorrichtung zur Spracherkennung, 

a) bei der ein Spracherkennungssystem vorgesehen ist, 

b) bei der ein Mittel zur Einstellung einer Genauigkeit 
des Spracherkennungssystems vorgesehen ist, das derart 
eingerichtet ist, daS Systemparameter des 
Spracherkennungssystems einstellbar sind, wobei die 
Systemparameter anhand einer EingangsgroSe ermittelbar 
sind . 

18. Vorrichtung nach dem vorherigen Anspruch, 

mit einer Einrichtung zur Leistungsmessung, die derart 
eingerichtet ist, daS die EingangsgroSe automatisch 
bestimmbar ist. 
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19. Vorrichtung nach Anspruch 17, 

mit einem Einstellelement , das derart eingerichtet ist, 
daS die EingangsgroSe durch das Einstellelement vorgebbar 
ist . 
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Zusammenf assung 

Verfahren und Vorrichtung zur Spracherkennung 

Es werden ein Verfahren und eine Vorrichtung angegeben, die 
bei einer Spracherkennung eine Einstellung einer Genauigkeit 
eines Spracherkennungssystems ermoglichen. Dazu werden anhand 
einer Eingangsgrofie uber eine Abbildungsvorschrif t 
Systemparameter des Spracherkennungssystems ermittelt und das 
Spracherkennungssystem entsprechend der auf diese Art 
bestimmten Werte eingestellt. Optional kann eine Adaption 
eines Spracherkennungssystems wahrend des Betriebs erfolgen, 
um eine anwendungsabhangige Anpassung in einem Bereich 
zwischen maximaler Qualitat bei der Spracherkennung und 
moglichst hoher Geschwindigkeit bei der Durchfuhrung der 
Spracherkennung zu gewahrleisten . Auch kann automatisch der 
Rechner eingestellt werden, indem zuvor anhand eines dafiir 
vorgesehenen Programmes ein Leistungsindex des Rechners 
bestimmt wurde, der ein Mate fur die EingangsgroSe darstellt 
und somit einen adaquaten Betrieb des Spracherkennungssystems 
auf diesem Rechner gewahrleistet . 
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